期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于一致性训练的半监督虚假招聘广告检测模型
王瑞琪, 纪淑娟, 曹宁, 郭亚杰
《计算机应用》唯一官方网站    2023, 43 (9): 2932-2939.   DOI: 10.11772/j.issn.1001-9081.2022081163
摘要133)   HTML11)    PDF (2191KB)(93)    收藏

虚假招聘广告的泛滥不仅会损害求职者的合法权益,还会扰乱正常的就业秩序,造成求职者极差的用户体验。为了有效检测出虚假招聘广告,提出一种基于一致性训练的半监督虚假招聘广告检测模型(SSC)。首先,对所有数据应用一致性正则项提升模型的性能;然后,通过联合训练的方式整合有监督损失和无监督损失得到半监督损失;最后,使用半监督损失对模型进行优化。在两个真实数据集EMSCAD (EMployment SCam Aegean Dataset)和IMDB (Internet Movie DataBase)上的实验结果表明,SSC在标签数据仅为20时取得了最好的检测效果,准确率与现有先进的半监督学习模型UDA (Unsupervised Data Augmentation)相比提升了2.2和2.8个百分点,与深度学习模型BERT (Bidirectional Encoder Representations from Transformers)相比提升了3.4和11.7个百分点,同时还具有较好的可拓展性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于带权评论图的水军群组检测及特征分析
张琪, 纪淑娟, 傅强, 张纯金
计算机应用    2019, 39 (6): 1595-1600.   DOI: 10.11772/j.issn.1001-9081.2018122611
摘要386)      PDF (949KB)(254)    收藏
针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区结构出发,利用社区发现算法生成最终的水军群组。在Yelp大型数据集上的实验结果表明,与 K均值聚类算法( KMeans)、基于密度的噪声应用空间聚类算法(DBscan)以及层次聚类算法相比WGSA算法的准确度更高,同时对检测到水军群组的特征与差异作了分析,发现水军群组的活跃度不同,危害也不同。其中,高活跃度群组危害最大,应重点关注。
参考文献 | 相关文章 | 多维度评价
3. 基于一致性训练的半监督虚假招聘广告检测模型
王瑞琪 纪淑娟 曹宁 郭亚杰